2019年全球人工智能发展趋势报告
编者按:关心AI的人一定希望了解这个行业的最新发展趋势,最近行业分析机构CBInsights最近发布了2019年AI趋势报告正好能满足这个需求。这份84页的报告识别了25种AI趋势,运用CBInsights的NExTT分析框架,从行业采用度和市场优势两个维度对其进行归类,可以为不同参与角色提供决策参考。
其关键发现是对电子商务搜索词的上下文理解正在摆脱“试验”阶段,不过距离广泛采用还有很长一段路要走;深度学习是当前绝大部分AI应用的引擎。不过因为胶囊网络,这种技术可能需要改进一下了;先进医疗保健与生物测定领域的研究人员正在开始利用神经网络研究和测定此前难以量化的非典型风险因素;能访问大型标签化的数据是训练AI算法的必需,而逼真的仿造数据也许能解决这一瓶颈。
为了方便各位了解,下面对这25种趋势进行摘要编译介绍。
2019年,处在风口浪尖上的人工智能行业机会在哪?
近期,创投研究机构CB Insights发布了2019全球人工智能发展的25个趋势。这25个人工智能发展趋势包括了:
针对这25个重要的AI趋势,CB Insights采用NExTT框架,根据行业采用率和市场优势评估了每一种趋势,并将其归类为暂时、必要、实验性、威胁性。对于未来战略和计划,希望本文能带给你一些启发。
NExTT框架
短暂:企业合作意愿、市场机会不确定性
必要:广泛的产业、客户应用和投资;市场接纳度
测试:试点企业或初创公司的产品没有被广泛应用;早期应用者驱动技术和趋势
威胁:大规模可行的市场预测、知名投资活动、不稳定/不确定性的应用
NExTT框架的两个维度
行业应用(Y轴):该领域创业企业情况、媒体关注、客户应用(合作、客户、授权交易)
市场优势(X轴):市场规模预测、盈利记录评论、投资机构和资本的质量及数量、竞争强度、对研发的投资、老牌企业交易(并购、战略性投资)
对于以下这些必然的AI趋势,
你需要一个明确清晰的战略和计划
必需
开源框架
AI的进入门槛变得空前的低,这要感谢开源软件。
以2015年Google开源TensorFlow机器学习库为开端,现在AI(尤其是深度学习)的开源框架已经形成百花齐放的局面,其中有Facebook的PyTorch、特利尔学习算法研究所(MILA)的Theano、Keras、Microsoft Cognitive Toolkit以及Apache MXNet等等。
开源AI框架是双赢的局面:一方面令人人都能用上AI;反过来,贡献者社区也为加速Google等公司的AI研究提供了帮助。
知名AI专家Yoshua Bengio表示:
支持深度学习研究的软件生态体系发展得很快,现在已经达到了一种健康的状态:开源软件成为规范;各种框架出现,满足了从探索新颖想法到生产部署的各种需求。而且不同的软件堆栈也在刺激的竞争氛围下得到了有力的行业玩家的支持。
边缘AI
对实时决策的需求正在将AI推向靠近边缘的地方。
在智能手机、汽车甚至可穿戴设备等边缘设备上运行AI算法,而不是跟中心云平台或服务器通信,使得边缘设备具备了在本地处理信息的能力,并且可以更快速地对情况做出响应。
Nvidia、高通、苹果及若干初创企业均在开发用于边缘的AI专用芯片。
2019年人工智能发展趋势全解析
边缘AI对消费者电子、电信、医疗影像等主流行业均有应用意义。比方说监控摄像头的人脸识别、华为、苹果等智能手机的人脸与对象识别、Tesla AI芯片的即时驾驶决策、婴儿监视器、无人机、机器人视觉能力(无互联网连接)等。
在2018年各大公司的财报会上,提到边缘计算的次数已经明显增多。
不过尽管边缘AI具有减少延时的优势,但也存在局限。那就是存储和处理能力受到限制。预计会有更多混合模式出现,使得智能边缘设备能够相互沟通以及与中心服务器通信。
脸部识别
从手机解锁到登机手续,人脸识别正在进入主流。
人脸识别在中国的媒体热度从2016年开始就不断升温。
中国对面部识别技术的需求与日俱增。
数据显示,美国对面部识别技术的兴趣也日益增加。
早期应用正在落地,尽管也会出现一些技术故障。例如,苹果在iOS10中引入基于面部识别技术的登录模式。据报道,亚马逊该技术报告错误的将政府议员识别为了犯罪分子。卡内基梅隆大学正在开发该技术帮助加强视频监控。
人脸识别的早期商业应用正在安保、零售及消费者电子领域出现,并且迅速成为生物特征识别的主流形式。
尽管人脸识别应用日益广泛,但这种技术并不是没有瑕疵。曾有报道称Amazon将一位国会议员认成了犯罪份子。华尔街日报记者用一张校长照片作为面具就轻易骗过了西雅图一所学校的智能摄像头。
医疗影像与诊断
美国FDA正在给AI即医疗设备开绿灯。
2018年4月,FDA批准了无需专家补充意见进行筛查糖尿病视网膜病变病人的AI软件。该软件叫做IDx-DR,其识别率达到了87.4%,对没有此病的识别率也达到了89.5%。
此外,FDA批准了初创企业Via.ai的CT扫描与潜在中风症状通知软件Viz LVO,以及初创企业Arterys的Oncology AI软件包,后者可以识别肺部与肝脏损伤。
监管的放松给商业化开辟了新的道路。自2014年以来,共有80家AI影像与诊断公司完成了149项融资交易。
初创企业Healthy.io的第一款产品Dip.io利用率了传统的尿液分析试纸来监控若干尿路感染:用户用智能手机拍摄试纸照片,计算机视觉算法就能根据不同的光照情况和相机品质对结果进行校正。产品可检测感染及怀孕相关的并发症。已在欧洲、以色列商用的Dip.io也已获得FDA放行。
FDA批准开放新的商业机会。例如,IDx公司的算法可以准确识别糖尿病性视网膜病变的病人,无需医生的进一步确认。ARTERYS的肿瘤人工智能套装,可以在初期发现肺部和肝部病变。Viz.ai公司的产品可以分析CT扫描发现中风的潜在可能。
预测性维护
AI工业物联网可为从制造商到设备保险商的既有者节省数百万美元的意外故障损失。
预测性维护利用传感器及智能摄像头不断采集机器数据(如温度、压力等)。生成的实时数据的规模以及格式的多样使得机器学习成为工业物联网不可或缺的组件。假以时日,算法就能够提前预测故障。
工业传感器成本的下降,机器学习算法的进展,以及边缘计算的推进,这些均使得预测性维护的应用变得更加广泛。
从下图可以看出,对领域的投资正在逐年递增。
2019年人工智能发展趋势全解析
其中活跃的投资者包括GE Ventures、西门子、SAP等。甚至微软等大公司也对自己的云与边缘分析解决方案进行扩展,提供预测性维护能力。
谷歌DeepMind的算法可以识别乳房活检中肿瘤存在的可能性。
从家庭智能相机、设备面部识别、无人车、无人机和机器人愿景,实时决策的需求推动边缘设备离人工智能更近。
答案是全部都是假的。每张图都是由对抗式生成网络GANs创造出来的。
电子商务搜索
对搜索词的上下文理解已经走出“试验”阶段,但是大规模采用仍有很长一段路要走。
自2002年以来,Amazon已经申请了35项与“搜索结果”有关的美国专利。其中包括利用卷积神经网络“确定一组图像与查询图像类似的物品”,利用机器学习分析图像的视觉特征,并基于此建立搜索查询等。
eBay则利用机器学习来分析卖家的产品描述,然后借此寻找同类产品。
但是很多买家都是使用自然语言来进行查询,这对电子商务搜索构成了挑战。新兴初创企业于是开始为零售商提供搜索技术。
图像搜索初创企业ViSenze的客户包括Uniqlo、Myntra、乐天等。它可以让进店客户拍摄喜欢的东西的照片,然后上传,在网上找到同样的产品。
获得阿里投资的以色列初创企业Twiggle正在基于电子商务搜索引擎开发语义API,对买家的特定搜索做出响应。
试验
胶囊网络
深度学习是当今绝大部分AI应用的引擎。但由于胶囊网络,这种技术现在可能需要改进一下了。
胶囊网络(CapsNet)是深度学习先驱Geoffrey Hinton 2017-18年时提出的概念,旨在克服当前图像识别方法(主要是卷积神经网络CNN)的缺陷。
这种缺陷主要有2个。一是难以识别精确空间关系。比方说右图中尽管嘴巴的相对位置发生了改变,CNN仍会将其识别成人脸。
2019年人工智能发展趋势全解析
二是无法从新的视角去理解对象。比方说下图中胶囊网络在识别1、2行为同一玩具的不同视角中表现要比CNN出色得多。CNN则需要更大的训练数据集才能认出每个方向的对象。已经有黑客通过引入少量噪音就能让CNN把目标误认成其他对象。
2019年人工智能发展趋势全解析
尽管目前对胶囊网络的研究仍处在初期阶段,但有可能对目前最先进的图像识别方法构成挑战。
下一代修复术
非常早期的研究正在出现,通过生物、物理、机器学习的结合来解决修复术最困难的问题之一:灵敏性。
从2006年开始,DARPA就投入了数百万美元跟约翰霍普金斯大学合作先进修复术计划来帮助受伤的老兵。但是这个问题解决起来并不容易。
比方说让截肢者活动假肢的手指,对自发运动背后的大脑和肌肉信号进行解析,然后再转换为自动控制均需要跨学科的知识。
最近,研究人员已经开始利用机器学习对植入人体的传感器的信号进行解码,然后将之翻译为移动假肢设备的指令。
约翰霍普金斯大学的应用物理实验室一个进行中的项目就是利用“神经解码算法通过”神经接口来控制假肢的。
去年6月,德国及帝国理工学院的研究人员利用机器学习解码截肢者残肢的信号,并让计算机来控制机械臂。
另一个思路是利用中介解决方案,比如利用肌电信号来激活摄像头,然后再用计算机视觉算法估计抓手类型以及面前物体的大小。
临床试验登记
临床试验的最大瓶颈在于登记合适的病人库。苹果有可能可以解决这个问题。
互操作性——也就是跨机构和软件系统分享信息的能力——是医疗保健的最大问题之一,尽管有了病历数字化的努力。
临床试验在这方面问题尤其严重,将合适的试验与适当的病人进行匹配是很耗时且充满挑战的过程。而光美国目前就有18000项临床研究正在招募病人。
理想的AI解决方案是由人工智能软件析取病人病历的相关信息,将之与进行中的试验进行对比,然后给出匹配的研究建议。
在病人与医疗保健计划匹配方面,苹果等技术巨头已经取得了一定的成功。
从2015年开始,苹果就推出了2个开源框架——ResearchKit与CareKit——来帮助临床试验招募病人,并且远程监控病人的健康状况。这些框架使得研究人员和开发者得以创建医疗app来监控人们的日常生活,化解了登记的地理障碍。苹果还在跟热门的电子病历供应商合作解决互操作性问题。
2018年6月,苹果面向开发者推出了Health Records API。用户现在可以选择向第三方应用和医疗研究人员分享数据,为疾病管理与生活方式监控打开新的机会。
生成对抗网络(GAN)
两个互相比聪明的神经网络正在变得非常擅长创作出逼真的图像。
你能认出下面哪些图像是假的吗?
CMU的研究人员使用GANs在“deepfake”视频换脸中,将John Oliver变成了Stephen Colbert。
拼多多CEO Colin Huang说,2017年,我们……主动删除了总共1070万有问题的商品并被封锁4000万个链接……提出了侵权行为问题……我们还与400多名合作品牌共同打击假冒产品。
新型基于AI的解决方案正在兴起。例如,Cypheme 采用随机模式的喷墨打印技术,每个随机的模式都是独一无二的,可与数据库商品相关联进行验证。Red Points 通过在线验证和机器学习为客户寻找假冒产品。Entrupy 开发了一个便携显微镜,可以安装在手机上。当用户将商品拍照上传时,人工智能算法会与真货数据进行比对。
用人工智能帮助产生更多的“逼真”合成数据来训练人工智能。Nvidia,比如,使用生成式对抗网络GANs来创造假的环游脑瘤的MRI图像。“这些结果可以为医疗影像中机器学习面临的两个最难的挑战提供潜在解决方案,也就是病例发现的概率较小,以及病人数据共享。”
答案是全都是。这些全都是GAN创造出来的。
生成对抗网络是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。该方法由Google研究人员Ian Goodfellow于2014年提出。生成对抗网络由一个生成网络与一个判别网络组成。生成网络从潜在空间(latent space)中随机采样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。
扩充GAN式的大规模项目的主要挑战是计算能力。Google研究人员在创建“BigGAN”用了512块TPU来创建512像素的图像,一次试验的电耗大概就要2450到4915千瓦时之间。这已经相当于普通美国家庭半年的电耗。
而且GAN要想扩充,AI硬件也的并行扩充。
除了有趣的试验以外,GAN也有其他严肃的用途,比如假冒政治视频和色情作品的换脸等。随着GAN研究的扩大,这种技术势必会对新闻、媒体、艺术及网络安全构成挑战。GAN已经改变了我们训练AI算法的方式。
联邦学习
这种新方法旨在用敏感用户数据训练AI的同时保护隐私。
我们跟智能设备的日常互动可以产生丰富的数据,这些数据用于训练AI算法的话可以极大地改善其表现,比如可以更加精确地预测你接下来要输入的字是什么。但是这些用户数据也会涉及到个人隐私问题。
Google于是提出了联邦学习的方案,旨在利用这一丰富数据集的同时保护敏感数据。简而言之,你的数据依然留在你的手机里,不会发送或存储到云服务器上。而是由云服务器将最新版的算法(算法的“全局状态”)发往随机选择的用户设备上。
你的手机做出改进然后基于本地化的数据对模型进行更新。之后只有这种更新(以及来自其他用户的更新)会回传给云服务器以改善该“全局状态”,然后再不断重复这一过程。
把单个更新聚合起来的做法其实并不新鲜,其他算法早就这样做了。联邦学习的不同在于它考虑了数据集的两个重要特征:
Non-IID:其他分布式算法均假设数据是独立同分布(Independent and identically distributed,IID)的,但其实每一部手机生成的数据都是独特的,因为不同的人使用习惯不同,联邦学习考虑到了这种不同。
不平衡:某些用户使用app更加活跃,自然也会产生更多的数据。因此每一部手机的训练数据量也不一样。
Firefox自称是在重要软件项目中首个实现联邦学习的用例之一。当用户在浏览器输入URL时,Firefox会利用联邦学习进行URL推荐排名。
AI初创企业OWKIN则利用联邦学习来保护敏感的病人数据。其方案可以让不同的癌症治疗中心在病人数据不离开本地的情况下进行协作。
先进医疗保健生物测定
研究人员正在开始利用神经网络来研究和测定此前难以量化的非典型风险因素。
Google的研究人员利用视网膜图像训练神经网络,然后再用该神经网络去寻找心血管风险因素。其研究发现,通过视网膜不仅可以识别年龄、性别、抽烟习惯等风险因素,还可以对这些因素量化到一定的精确程度。
类似地,梅奥诊所也跟以色列初创企业Beyond Verbal合作,通过分析声音的声学特征来寻找冠心病人独特的声音特性。研究发现,当受试者描述一段情感经历时,有两个声音特性跟冠心病存在强关联。
初创企业Cardiogram最近的研究发现,利用深度学习,糖尿病引起的心率变异性改变可通过现成的可穿戴心率传感器检测出来。其检测精确率可达85%。
AI寻找模式的能力将会继续为新的诊断方法和识别此前未知的风险因素开辟新的道路。
自动索赔处理
保险公司和初创企业正开始用AI计算车主的“风险评分”,对事故场景图片进行分析,并监控司机行为。
蚂蚁金服在“事故处理系统”中利用了深度学习算法来进行图片处理。过去需要理算员现场处理的事情现在可以由先进图像处理承担了。车主只需上传车辆照片给蚂蚁金服,神经网络就会分析图片,自动进行损失评估。
蚂蚁金服还建立了司机的风险档案来影响车险的定价模型。他们引入了所谓的“车险分”,基于信用记录、消费习惯、驾驶习惯等利用机器学习计算车主的风险评分。
初创企业Nexar鼓励司机把自己的智能手机当成行车记录仪使用,并且将记录上传给Nexar app。车主的好处是可以有车险的折扣。
拿到视频的app会利用计算机视觉算法监控路况、司机行为以及事故。App还提供了“事故重现”功能,并与保险客户合作处理索赔。
初创企业Tractable可以让保险公司将受损车辆图片及车损估价上传到其索赔管理平台。“AI Review”功能就可以将这些资料与库中的几千图片对比,然后进行相应的定价调整。
防伪/打假
假货越来越难以识别,而在线购物又让卖假货变得空前的便利。为此,品牌商正在开始利用AI来打假。
拼多多在18年Q3财报会上提了11次“假货”,称“打击假货和不诚信商家非常困难。”
品牌正在两条战线上对抗假货的冲击:
在线上,需要识别并让侵权商品下架。
在线下,需要识别宰客的假货(如高级手包)。
阿里巴巴正在利用深度学习持续扫描自家平台以发现IP侵权的情况。它利用了图像识别来确认图片的特征,再加上语义识别,从而监控上架商品图片中是否有品牌名称或者口号。
造假者会利用跟品牌十分类似的关键字和图片来销售假货。而且他们就像牛皮藓一样,一旦假货下架之后,他们又会换一组关键词重新发布同样的假货。
初创企业Red Points正在利用机器学习扫描网站潜在的侵权情况,并且找出造假者使用的关键字选择模式。
线下打假就更加棘手了,而且需要更大的人力。
卖家卖或者典当二手奢侈品手包时,验证过程通常需要鉴定专家亲自检查手包的工艺、材料及缝线模式。
但是一些A货已经逼真到肉眼无法辨别的地步。
初创企业Entrupy 跟鉴定专家合作建立真品、赝品数据库来训练算法已有2年时间。他们利用一种可以连接智能手机的便携式显微镜让用户拍照上传物件图片,算法再分析是否具备真品独有的微观特征。不过这种办法也有局限性。因为大多数按照标准规定制造的产品都有类似的特征(造假者也运用了这些工艺)。而且像芯片、纳米材料这样的东西并不适用。
Cypheme采用的是另一种办法。基于人工智能的防伪溯源技术,通过使用特种纸张作为媒介制作标签,并可进行产品溯源。公司宣称这种标签使用了独家技术,是无法仿造的。而且即便标签是原件,如果不在数据库中有记录,产品也会被识别为假货。
免收银零售
进店、拿货、出门,这几乎给人感觉就是入店行窃。AI可以让过去被视为盗窃的事情及免收银零售变得更加常见。
Amazon Go就彻底取消了收银流程,让顾客进店取货即走。但是Amazon并没有详细介绍过未来的运营和商业计划,只是说实现利用了传感器、摄像头、计算机视觉及深度学习算法但否认使用了人脸识别技术。
像Standard Cognition和AiFi这样的初创企业则抓住了机会,将Amazon Go的方案普及到零售商。免收银商店的一大挑战是如何向适当的顾客收取正确的费用。
迄今为止Amazon Go是唯一成功的商业案例,但是这个案例有很多因素是受控的。只有Prime会员才能进店。其他人要想效仿,必须先建立起自己的会员制。
AiFi的方案是如果下载其app就可以拿货走人,不愿意下载的可以单独开辟收银台。但是商店的基础设施应如何支持这两种方案尚不清楚。
另一大问题是销售点存货损耗问题,比如算错钱或者偷盗。依图与东芝的智能收银摄像头是其中一些解决方案。但是防偷盗问题与运营范围和规模相关。Amazon Go只有1800到3000平方英尺,但使用的摄像头就达到了数百个。几乎把每一寸地方都覆盖到了。但传统的超市一般都有40000平方英尺或以上,需要解决摄像头如何布局才能高效的问题。
此外,由于商品种类繁多,如何才能识别哪位购物者取走了哪件商品呢?这些需要重量传感器、摄像头以及计算机视觉算法足够强大。
Standard Cognition跟日本最大的CPG批发商百陆达合作,宣称要在2020年东京奥运会前改造3000家店铺。AiFi据报道已有20个零售商客户。
近期而言,这项技术的发展要取决于部署成本及存货损失成本,以及零售商能否承担这些成本和风险。
后端办公自动化
AI正在对事务性工作进行自动化,但是数据的不同属性和格式会对这项工作构成挑战。
不同的行业和应用都有其独特的挑战。比方说临床试验里面很多试验都是手写记录然后数字化的。但是这种格式往往难以搜索,而手写的临床记录又会对自然语言处理构成独特挑战。车险索赔自动处理中评估损伤和追溯事故根源时也会遇到麻烦。
不过不同的板块都在开始不同程度地采用基于机器学习的工作流解决方案。机器人流程自动化(Robotic Process Automation ,RPA)泛指任何重复性的后端事务性工作的自动化,最近是炒作的主题之一。但就像AI一样,这个词涉及内容也是包罗万象,从数据录入到合规性检查、交易处理、客户培训不等。
很多ML解决方案已经开始将图像识别与语言处理整合到一起。
比如WorkFusion就把了解客户与反洗钱这样的后端运营工作自动化了。独角兽UiPath的服务已拥有700多家企业客户,包括DHL、NASA、HP等。Automation Anywhere是另一家独角兽。该公司有一个案例是跟一家全球银行合作,用机器学习进行自动化人力资源管理。“IQ机器人”会从多个国家多种语言提交的表格中提取信息、清洗数据,然后自动录入到人力资源管理系统内。
不过RPA在很多行业尚处在起步阶段,有的在叠加预测性分析曾之前还得闲解决数字化的问题。
语言翻译
语言翻译的NLP既是挑战也是有待发掘的市场机遇。大公司正在挑战极限。机器翻译在后端办公自动化存在着巨大商机,在跨国组织、客户支持、新闻&媒体等领域均有应用机会。
百度的耳机翻译器跟Google Pixel buds类似,据称能完成40种语言的实时互译。有的初创企业比如Unbabel则引入了人参与到记忆翻译系统当中,目标是用反馈回环来训练算法改进。
1年前,Yoshua Bengio提出了用神经网络架构来取代传统统计法的翻译方案,后来Google就升级了Google Translate Tool的算法。Google原先采用的是基于短语的机器翻译(PBMT),其新的工具采用了神经机器翻译(GNMT)方案,并且提出了解决训练模型时遇到的时间和计算资源问题的解决方案。
不过最近的突破却是来自Facebook的。据称其突破在于过去的方法只有在资源丰富的语种互译时比较有效,但对少数语种的翻译就比较有局限性。Facebook提出了一种可学习 93 种语言的联合多语言句子表征架构。该架构仅使用一个编码器,且可在不做任何修改的情况下实现跨语言迁移。
随着大公司不断投入资源到改进翻译框架之中,翻译效率和语言能力也将得到改善,预计机器翻译将会在更多行业得到采用。
合成训练数据
训练AI算法离不开大规模的标签数据集。而逼真的仿造数据有望解决这个瓶颈问题。
AI算法的表现取决于获得的数据,但是为不同应用获取数据并给数据打上标签却是耗时耗钱的活儿,甚至没有可行性(不妨设想无人车需要的危险情况数据)。
合成数据集可以解决这个问题。2018年3月,英伟达推出了NVIDIA推出DRIVE Constellation仿真系统,称可以在虚拟现实环境中测试自动驾驶汽车安全行驶数十亿英里。
比方说设想无人车行驶过程中遇到雷暴。英伟达的解决方案会模拟这种情况下车载传感器(摄像头或LiDAR)会生成什么样的数据。合成的传感器数据再提供给计算机进行决策,就好像自己真的在开车一样,然后把命令回传给虚拟汽车。
一个有趣的新兴趋势是利用AI本身帮助生成更“逼真”的合成图像来训练AI。比方说英伟达就用GAN来生成假的脑瘤MRI图像。
GAN可用来“增强”现实世界数据,意味着AI可以用混合现实世界和模拟数据来进行训练,从而形成更大规模更多样化的数据集。
机器人是另一个极大受益于高精度合成数据的领域之一。类似AI.Reverie这样的早期阶段初创企业正在开发仿真平台为不同行业和场景生成数据集。
随着技术的发展以及合成数据能够更精确地模拟现实场景,预计这会成为无法获取大规模数据集的小公司的催化剂。
威胁
强化学习
从训练算法击败棋类游戏的世界冠军,到教AI耍杂技,研究人员正在用强化学习挑战极限。但对大规模数据集的需求目前限制了实际应用。
强化学习因为DeepMind的AlphaGo而引起了媒体的大量关注。
简而言之,强化学习的要点就是为了实现目标获得最大回报你需要干什么?
也正因为此,强化学习在游戏和机器人仿真方面的发展最好。DeepMind的AlphaGo一开始是利用率有监督学习(用其他人类玩家数据训练算法)和强化学习(AI跟自己下)的。不过后来的AlphaGo Zero就完全是用强化学习来实现超人的表现了。
最近加州大学伯克利分校的研究人员开始用计算机视觉和强化学习教算法学习YouTube视频上的杂耍视频。在无需人工标记姿势的情况下,计算机仿真角色就能重复视频里面的动作。而且还能在新环境中应用学到的技能。
2019年人工智能发展趋势全解析
不过强化学习的采用情况跟目前最普遍的有监督学习完全不能同日而语。但强化学习的专利申请情况却是在不断增长的。
网络优化
从促进频谱共享到资产监控乃至于天线的优化设计,AI正在开始改变电信。电信网络优化是一组改进延时、贷款、设计或者架构的技术,任何以有利的方式增强数据流的东西都算。对通信服务提供商来说,优化会直接转化为更好的客户体验。
除了带宽限制之外,通信面临的最大挑战之一是网络时延。类似手机AR/VR这样的应用只有在时延极低的情况下才好用。
苹果最近被授予了一项专利,就是用机器学习来组建“预期网络”,预计像智能手机这样的无线设备在未来可能会执行什么样的操作,从而提前下载数据包以降低时延。
机器学习的另一项新兴应用是频谱共享。频谱共享是解决频率资源短缺的必然之道。FCC(美国联邦通信委员会)要求,3.5到3.7GHz频段必须由不同用户共享。也就是说运营商可基于可用性动态访问共享的频谱,从而可以根据网络需求对带宽进行调整。而没有获得专用频谱许可的较小商业用户也可以访问。
像Federated Wireless这样的公司提供了Secure Spectrum Access(SAS,安全频谱访问)来动态分配频谱给不同等级的用户,确保不会造成干扰。
2018年,Federated Wireless被授予了一项专利,该专利运用了机器学习技术来对无线信号进行分类,同时又隐藏了联邦信号的特征,从而避免被黑客利用。
DARPA则希望最终能从SAS转到完全基于ML的自动化系统。为此它在2016年推出了鼓励参赛者想出自主协作动态分配频谱办法的Spectrum Collaboration Challenge。并在2017年推出了Radio Frequency Machine Learning Systems,跟Federated Wireless的方案类似,DARPA也是希望用ML区分不同类型的信号。
电信玩家也准备将基于AI的解决方案整合进下一代无线通信技术,也就是5G当中。
三星为了应对5G时代的到来而收购了基于AI的网络与服务分析初创企业Zhilabs,称其软件将用于分析用户流量,对应用进行分类,改善整体服务质量。
高通则把AI边缘计算看作其5G计划的关键部分。
还有一些研究论文开始探索用神经网络来设计最优化的天线。
无人车
尽管无人车市场商机无限,但何时实现全自动尚不明朗。大量技术巨头和初创企业正在这个领域拼得头破血流。
这个领域最富盛名的是Google。其Waymo已经在率先部署了无人车商业车队。投资者的投资热度依然没有消退。去年GM的Cruise Automation就拿到了10多亿美元的融资,Zoox也融了5亿美元。其他的初创企业还包括Drive.ai、Pony.ai与Nuro等。
中国在无人车方面尤其加大了投入。2017年,百度发布了无人驾驶开放平台阿波罗,旨在将全球合作伙伴捆绑到一起,通过生态体系其他玩家的贡献来加速AI和无人驾驶的研究。阿里巴巴也改变了怀疑态度,最近也对其无人车进行了试驾。
而尽管对这项技术的未来仍有怀疑,车企还是开足了马力。预计到2025年该市场将达到800亿美元。一些行业有望成为无人车的第一个吃螃蟹者,比如物流和履约中心。
2019年人工智能发展趋势全解析
自动化物流——尤其是最后一公里的送货——是零售商和履约公司的头号关切,也是有望率先实现全自动的领域。无人车可以帮助应对费钱费力的最后一公里送货问题(成本将近配送成本的1/3)。
像美国亚利桑那州这样的地方对无人车部署比较友好,从而成为了热门的试验场。2018年6月,机器人初创企业Nuro开始跟美国最大百货商Kroger合作配送百货。跟其他配送机器人不同,它的配送机器不仅在人行道行走,而且还会在社区道路行驶。
在饭店业,Domino’s和必胜客是试验无人车的先驱。福特正在迈阿密试验配送比萨、百货等商品。包括Domino’s在内,其合作伙伴已经超过了70家企业。
作物监控
三种类型的作物监控正在农业领域取得发展:地面、空中及地理空间。精准农业无人机市场到2021年预计将达到29亿美元。
无人机可以进行土地映射、利用热成像监控含水量,识别虫患以及喷洒农药。初创企业则关注于在第三方无人机捕捉到的数据之上增加一个分析层。
比方说Taranis就用第三方的Cessna飞机来做这件事情。去年aranis还收购了农业AI技术初创企业Mavrx Imaging,后者开发了超高清影像技术来巡视和监控土地。Taranis还利用AI技术来拼接土地成像,并且来帮助识别潜在的作物问题。
农机设备制造商John Deere也在利用AI来重塑自己。它收购了农机设备公司Blue River Technology。后者有利用计算机视觉来进行智能除草与喷洒解决方案。
此类个体作物监控有望成为精准农业的主要颠覆者。如果地面农机设备靠计算机视觉而变得更加智能,并且只喷洒有需求的作物的话,就可以减少对消灭附近一切的除草剂的需求。精准喷洒也意味着除草剂、杀虫剂使用量的减少。
除了田地以外,计算机视觉还可以对卫星影像进行分析,从而为农业耕作提供宏观层面的理解。比如嘉吉公司就投资了Descartes Labs,后者利用卫星数据为大豆、玉米等作物建立了一个预测模型。DARPA也在跟Descartes合作来预测作物安全。
暂时
网络威胁追捕
对网络攻击做出反应已经不够了。利用机器学习主动“搜寻”威胁正在网络安全取得良好的发展势头。
计算能力与算法的进步正在把以前只有理论上可行的破解变成了真正的安全问题。2018年全球共有4.5PB的数据被盗用。相比之下,2017年为2.6PB。
跟AI的其他行业应用不一样,网络防御是黑客与安全人士之间的一场猫捉老鼠的游戏,双方均利用机器学习的进步来获取优势。
威胁搜寻是主动寻找恶意活动而不是对告警或者破坏情况发生后再被动反应。
搜寻从假设网络存在潜在缺陷开始,然后利用手工或者自动化工具来测试该假设,这是一个持续的、不断迭代的过程。不过网络安全所涉及的数据量使得机器学习成为该过程不可或缺的一部分。
不过尽管不同业务对威胁捕捉均有需求,但目前仍属于较为小众化的方向。拥有大量数据资源的大型企业会更加关切这个东西。
比方说,Amazon就收购了威胁追捕初创企业Sqrrl来开发产品,抓捕AWS客户账号上的黑客。另一AI初创企业Cylance的关注点也是威胁追捕,去年也已被黑莓收购。
网络的覆盖面越广就越容易受到攻击。威胁追捕有可能会有更大的发展势头,但是这个东西本身也有挑战性,比如如何应对不断变化的动态环境以及减少误报问题。
对话式AI
对于很多企业来说,聊天机器人已成AI的同义词——但是希望跟不上现实。Google的会话式AI功能Duplex遇到了麻烦。
Duplex可以替用户打电话和进行预订,而且沟通方式就像人一样。但是这引发了道德担忧,大家质疑Duplex跟人对话时是否应该表明自己的身份。Google还把Duplex集成到了自己的新手机Pixel 3里面。这让这部智能手机成为了AI的动力室,里面还有一个“来电筛选”的选项,可以让Google Assistant筛选掉垃圾来电。
美国的FAMGA和中国的BAT均在该领域投入了大量资源,但会话式AI暂时只在某些应用领域具备一定的可行性。其中最广泛的应用之一是客户服务。聊天机器人(注:并非所有机器人都采用自然语言处理)形成了跟用户交互的第一层,然后根据复杂性程度再把查询交给人处理。
但是医疗保健和保险的应用就比较有挑战性,因为这些领域的分类(测定情况的紧急程度)很复杂。
类似地,基于语音的对话式购物者没有视觉线索的情况下也很有挑战。尽管分析师和CPG品牌均谈到了语音购物可能是零售的下一个大事物,但这个东西还是没有做起来。除了记录特别物品外,它未能提供可带动在线贸易的关键客户体验。
心理保健是聊天机器人有望成为颠覆性力量的另一个领域。心理保健的高成本与全天候服务的吸引力导致了基于AI的心理保健机器人新时代的崛起。
早期阶段初创企业的关注点是利用认知行为疗法来作为许多情绪跟踪和数字健康日记app的会话式扩展。但是心理健康的范围也很大,不同心理疾病在症状、分析主观性上各异,而且需要高级的情绪认知和人际互动。
所以尽管会话式AI具备成本和便利性的优势,但在像心理保健这样的领域应用会面临很大的困难。
药物发现
随着AI生物技术初创企业的出现,传统制药公司正在寻求通过AI SaaS初创企业来获得长周期的药物发现的创新性解决方案。
2018年,辉瑞跟AI初创企业XtalPi达成了一项战略合作关系,双方一起合作来预测小分子的制药属性,并开发“基于计算的合理药物设计”。
顶级制药公司像诺华、赛诺菲、葛兰素史克、安进以及默克等均在最近宣布了跟AI初创企业的合作关系,以便为从肿瘤到心脏病等疾病发现新的候选药物。
对本领域的兴趣也推动了AI药物发现初创企业股权交易的发展,2018年Q2的交易数达到了20桩,相当于2017年全年。像Recursion Pharmaceuticals这样的生物技术AI公司在AI与药物研发方面均有投入,而传统制药公司主要是跟AI SaaS初创企业合作。
尽管许多这样的初创企业仍然处在融资的早期阶段,但是均声称已有制药公司客户。虽然药物配方阶段的成功指标寥寥无几,但制药公司正在押注数百万美元到AI算法身上,希望能发现新颖的治疗候选方案,并且改变冗长的药物发现流程。
往期精彩必读文章(单击就可查看):
1.美国科学院院士、图灵奖得主:约翰•爱德华•霍普克罗夫特——深度学习
2.南京大学教授:周志华——深度森林:探索深度神经网络以外的方法
3.斯坦福大学人工智能实验室主任:李飞飞——ImageNet之后,计算机视觉研究最新进展
6.国防科技大学教授:殷建平——计算机科学理论的过去、现在与未来
7.图灵奖得主Hamming的22年前经典演讲:如何做研究,才能不被历史遗忘
8.当这位70岁的Hinton老人还在努力推翻自己积累了30年的学术成果时,我才知道什么叫做生命力(附Capsule最全解析)